标签数据和准确性

标记的数据和准确性

标签

标签是附加到特定图像上的标记，它能向你提供这张图像的相关信息。在本节课中，我们将为每张图像添加标签。这些标签将图像数据分为不同类，而这些类就像一般类别。

对于我们的日/夜图像，我们有两个标签：“日”和“夜”。

我们为什么需要标签?

你可以分辨图像是夜晚还是白天，但电脑不能，除非我们用标签来明确告诉它！

当我们测试分类模型的准确性时，这变得尤为重要。

一个分类器接受一个图像作为输入，并应输出一个 predict_label ，告诉我们该图像的预测类。现在，当我们加载数据时，就像你所看到的那样，我们加载所谓的 true_labels ，它们是图像的 correct 标签。

为了检查分类模型的准确性，我们比较了预测标签和真实标签。如果真实和预测的标签匹配，那么我们已经正确地分类图像！有时标签不匹配，这意味着我们错误地分类了图像。

一个错误的图像的例子。 true_label 是 “day”，而 predict_label 是 “night”。

精确性

在查看许多图像之后，分类器的准确度被定义为正确分类的图像的数量（predicted_label 匹配真实标签的数量）除以图像的总数量。这也就是说，假设我们试图分类 100 张图像，并正确分类了 81张。我们的准确性为 0.81 或 81%！

只有当拥有这些预测和真实标签来进行比较时，我们才能让计算机检查分类器的准确性。我们也可以从分类器所犯的任何错误中学习，这一点我们将在本节课的后面学习。

数字标签

与使用字符串或分类标签相比，使用数字标签是很好的做法，因为它们更容易跟踪和比较。所以，对于这个日/夜图片二进制类的例子，我们不采用“日”和“夜”的标签，而是使用数字标签：0 为夜晚，1 为白天。

你已经熟悉了日/夜图片的数据，并且知道了标签是什么，以及为什么使用它们。现在你准备好接下来的工作了，我们将建立一个完整的分类流程！

先思考一下，我们将采取什么步骤来分类这些图像。